Chapter 7. LLM-as-a-Judge: 평가용 AI 모델을 활용한 하이브리드 오라클 시스템
- 7.1 LLM-as-a-Judge의 개념적 정의와 오라클로서의 역할
- 7.2 평가 모델(Judge Model) 선정과 아키텍처 패턴
- 7.3 하이브리드 오라클 설계를 위한 평가 기준(Rubric) 정립
- 7.4 평가 신뢰도 확보를 위한 프롬프트 엔지니어링 (Meta-Prompting)
- 7.5 LLM 심판관의 편향(Bias) 종류와 완화 전략
- 7.6 Meta-Evaluation: 오라클 자체의 신뢰성 검증
- 7.7 결정론적 검증과 LLM 평가의 파이프라인 통합 (Hybrid Execution)
- 7.8 비용 효율적인 LLM 오라클 운영 전략
- 7.9 실전 사례 연구: 하이브리드 오라클 적용